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Beschrcibung 

Die Erfindung betrifft ein Verfahren zum Aufbereiten einer Datenbank fur die automatische Sprachverarbeitung, so- 
wie ein Verfahren zum Trainieren eines neuronalen Netzwerkes zum Zuordnen von Graphemen zu Phonemen fur die au- 
5 tomatische Sprachverarbeitung und ein Verfahren zum Zuordnen von Graphemen zu Phonemen bei der Synthetisierung 
von Sprache bzw. bei der Erkennung von Sprache. 

Es ist bekannt, neuronale Netzwerke fur die Synthetisierung von Sprache zu verwenden, wobei die neuronalen Netz- 
werke einen Text, der in einer Folge von Graphemen dargestellt ist, in Phoneme umsetzen, welche von einer entsprechen- 
den Sprachausgabevorrichtung in die korrespondierenden akustischen Laute gewandelt werden. Grapheme sind Buch- 
10 staben beziehungsweise Buchstabenkombinationen, welchen jeweils ein Laut, das Phonem, zugeordnet ist. Vor einem 
erstmaligen Einsatz des neuronalen Netzwerkes muB dieses trainiert werden. Dies erfolgt iiblicherweise durch Verwen- 
dung einer Datenbank, die die Graphem-Phonem-Zuordnungen enthalt, wodurch festgelegt ist, welchem Graphem wel- 
ches Phonem zugeordnet ist. 

Die Erstellung einer solchen Datenbank bedeutet einen erheblichen zeitlichen wie auch geistigen Aufwand, da derar- 
15 tige Datenbanken in der Regel nur mit Hilfe eines Sprachexperten aufgebaut werden konnen. 

Aus DE 197 51 123 CI ist eine Vorrichtung bekannt, die einen Speicher aufweist, der durch alphanumerische Einga- 
. ben von benutzerdefinierten Namen und assoziierten Rufnummern belegt wird, wobei ein Graphem-Phonem-Umsetzer 
aus dem eingegebenen Namen ein entsprechendes digitales Wortmodell erstellt, welches zusammen mit dem Text oder 
einem diesem zugeordneten Code derart gespeichert wird, dass ein Spracherkenner darauf zugreifen kann. 
20 DE 689 13 669 T2 offenbart eine Graphem-Phonem-Umsetzung, bei der aus mehreren Graphemen eine wahrschein- 
lichste Sprachgruppe erzeugt wird, die dann in Phoneme umgesetzt wird. 

WO 99 40568 Al beschreibt da Zerlegen eine Sprachdatenstroms in Phoneme mittels eines neuronalen Netzes, das 
auf ein Erkennen von in einem ausgewahlten sprach- und/oder sprecherspezifischen Phonemkatalog hinterlegten Phone- 
men trainiert ist. 

25 Der Erfindung liegt die Aufgabe zugrunde ein Verfahren zu schaffen, mit welchen auf einfache Art und Weise eine 
Graphem-Phonem-Zuordnungen enthaltende Datenbank erstellt werden kann. 

Die Aufgabe wird durch ein Verfahren mit den Merkmalen des Anspruchs 1 gelost. Vorteilhafte Ausgestaltungen der 
Erfindung sind in den Unteranspruchen angegeben. 

Das erfindungsgemaBe Verfahren zum Aufbereiten einer Datenbank fur die automatische Sprachverarbeitung geht von 
30 einer Datenbank aus, die Worter in Form von Graphemen und Phonemen enthalt. Fiir die meisten Sprachen existieren be- 
reits derartige Datenbanken. Diese Datenbanken sind Worterbiicher, die die Worter in Schreibschrift (Grapheme) und in 
Lautschrift (Phoneme) enthalten. Diesen Datenbanken fehlt jedoch die Zuordnung der einzelnen Phoneme zu den ent- 
sprechenden Graphemen. Diese Zuordnung wird erfindungsgemaB automatisch durch die folgenden Schritte ausgefiihrt: 

35 a) Zuordnen der Grapheme zu den Phonemen aller Worter, die dieselbe Anzahl Grapheme und Phoneme besitzen, 

wobei die Grapheme und Phoneme einander paarweise zugeordnet werden, 

b) Zuordnen der Grapheme zu den Phonemen aller Worter, die mehr Grapheme als Phoneme besitzen, wobei zu- 
nachst alle Grapheme den Phonemen paarweise zugeordnet werden, bis sich ein Zuordnungsfehler auf Grundlage 
der bisher ermittelten Zuordnungen ergibt oder lediglich am Wortende ein oder mehrere Grapheme vorhanden sind, 

40 welchen kein Phonem zugeordnet ist, und Zusammenfassen mehrerer Grapheme zu einer Graphemeinheit und Zu- 

ordnen eines Graphems zu der Phonemeinheit, und 

c) Zuordnen der Grapheme zu den Phonemen aller Worter, die weniger Grapheme als Phoneme besitzen, wobei 
mehrere Phoneme zu einer Phonemeinheit zusammengefaBt werden und ihnen ein einziges Graphem derart zuge- 
ordnet wird, daB die iibrigen Graphem-Phonem-Zuordnungen des zu analysierenden Wortes den unter a) und b) ge- 

45 fundenen Zuordnungen entspricht, 

d) Zuordnen der bisher nicht zuordbaren Worter, wobei die Worter nach den unter c) ermittelten Phonemeinheiten 
und/oder den unter b) ermittelten Graphemeinheiten untersucht werden und die Phoneme zu den Graphemen unter 
Beriicksichtigung der Phonemeinheiten und/oder Graphemeinheiten zugeordnet werden, und 

wobei zumindest nach Schritt a) ein Korrekturschritt ausgefiihrt wird, mit dem Zuordnungen von Wortern, die im 
50 Widerspruch zu den im Schritt a) ermittelten weiteren Zuordnungen stehen, geloscht werden. 

. ErfindungsgemaB werden zunachst Worter untersucht, die dieselbe Anzahl Grapheme und Phoneme besitzen. Die 
Grapheme dieser Worter werden den Phonemen paarweise zugeordnet, wobei in einem darauffolgenden Korrekturschritt 
die Zuordnungen der Worter geloscht werden, die im Widerspruch zu den weiteren Zuordnungen stehen. 

55 Mit diesem ersten Zuordnungsvorgang kann eine GroBzahl der Worter abgearbeitet werden und zudem statistisch si- 
gnifikante Zuordnungen erzielt werden, die eine Uberpriifung im Korrekturschritt erlauben und die auch eine Uberpru- 
fung der weiteren zu erstellenden Zuordnungen in den nachfolgenden Schritten erlauben. 

Danach werden die Worter untersucht, bei denen sich die Anzahl der Phoneme gegeniiber der Anzahl von Graphemen 
unterscheidet. Bei Wortern mit mehr Graphemen als Phonemen werden mehrere Grapheme zu Graphemeinheiten zu- 

60 sammengefaBt und bei Wortern mit weniger Graphemen als Phonemen werden Phoneme zu Phonemeinheiten zusam- 
mengefaBt. 

Nach Beendigung dieser Schritte werden die bisher nicht zuordbaren Worter iiberpriift, wobei hierbei die ermittelten 
Phonemeinheiten und/oder die ermittelten Graphemeinheiten beriicksichtigt werden. 

Mit dem erfindungsgemaBen Verfahren wird somit schrittweise automatisch ein "Zuordnungswissen" erstellt, das zu- 
65 nachst auf paarweisen Graphem-Phonem-Zuordnungen beruht und in das im Laufe des Verfahrens auch Graphemeinhei- 
ten und Phonemeinheiten einbezogen werden. 

Das erfindungsgemaBe Verfahren kann fiir jede beliebige Sprache angewandt werden, fur die bereits eine elektronisch 
lesbare Datenbank besteht, die Worter in Form von Graphemen und Phonemen enthalt, wobei eine Zuordnung zwischen 
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den Phonemen und Graphemen nicht notwendig ist. Der Einsatz von Expertenwissen ist nicht erforderlich, da das erfin- 
dungsgemaBe Verfahren vollautomatisch ausgefuhrt wird. 

Mit der erfindungsgemaB erstellten Datenbank kann dann ein neuronales Netzwerk trainiert werden, mit dem die Gra- 
phem-Phonem-Zuordnungen bei der Synthetisierung oder Erkennung von Sprache automatisch ausgefuhrt werden. 

Die Erfindung wird nachfolgend naher anhand eines Ausfuhrungsbeispieles erlautert, das in den Zeichnungen darge- 5 
stellt ist. In diesen zeigen: 

Fig. 1 ein Ausfuhrungsbeispiel des erfindungsgemaBen Verfahrens in einem FluBdiagramm, 

Fig. 2 schematisch ein neuronales Netzwerk zum Zuordnen von Graphemen zu Phonemen, und 

Fig. 3 schematisch eine Vorrichtung zur Ausfuhrung des erfindungsgemaBen Verfahrens. 

Das erfindungsgemaBe Verfahren dient zum Aufbereiten einer Datenbank fur die Sprachsynthese, wobei von einer 10 
Ausgangsdatenbank ausgegangen wird, die Worter in Form von Graphemen und Phonemen enthalt. Eine solche Aus- 
gangsdatenbank ist jedes Worterbuch, das die Worter sowohl in Schreibschrift (Grapheme) als auch in Lautschrift (Pho- 
neme) enthalt. Diese Worterbiicher enthalten jedoch keine Zuordnung der einzelnen Grapheme zu den jeweiligen Pho- 
nemen. Sinn und Zweck des erfindungsgemaBen Verfahrens ist die Erstellung einer solchen Zuordnung. 

In Fig. 1 ist ein Ausfuhrungsbeispiel des erfindungsgemaBen Verfahrens in einem FluBdiagramm dargestellt. In einem 15 
Schritt S 1 wird das Verfahren gestartet. 

Im Schritt S2 werden alle Worter untersucht, die die gleiche Anzahl Grapheme und Phoneme besitzen. Die Grapheme 
dieser Worter werden den entsprechenden Phonemen paarweise zugeordnet. 

Eine derartige paarweise Zuordnung wird z. B. fur das englische Wort "run" ausgefuhrt, das folgendermaBen mit sei- 
nen Graphemen und Phonemen dargestellt werden kann: 20 

Grapheme: run 
Phoneme: r A n 

Bei "run" wird das Graphem "r" dem Phonem "r", das Graphem "u" dem Phonem "A" und das Graphem "n" dem Pho- 25 
nem "n" zugeordnet. Bei dieser paarweisen Zuordnung wird somit jeweils ein einziges Graphem einem einzigen Phonem 
zugeordnet. Dies wird fur alle Worter ausgefuhrt, die die gleiche Anzahl von Phoneme und Grapheme besitzen. 

Im nachfolgenden Schritt S3 wird eine Korrektur ausgefuhrt, mit der die Zuordnungen der Worter, die im Widerspruch 
zu dem im Schritt S2 ermittelten weiteren Zuordnungen stehen, geloscht werden. Hierzu werden die Haufigkeiten der 
einzelnen Graphem-Phonem-Zuordnungen erfaBt und Graphem-Phonem-Zuordnungen die nur selten vorkommen wer- 30 
den geloscht. Liegt die Haufigkeit einer bestimmten Graphem- Phonem-Zuordnung unter einem vorbestimmten Schwell- 
wert, so werden die entsprechenden Graphem-Phonem-Zuordnungen geloscht. Der Schwellwert liegt z. B. im Bereich 
von einer Haufigkeit von 10 bis 100. Je nach Umfang des Vokabulars der Ausgangsdatenbank kann der Schwellwert ent- 
sprechend angepaBt werden, wobei bei groBeren Ausgangsdatenbanken ein hoherer Schwellwert als bei kleineren Aus- 
gangsdatenbanken zweckmaBig ist. 35 

Ein Beispiel fiir eine derartige widerspriichliche Graphem-Phonem-Zuordnung ist das englische Wort "fire": 

Grapheme : f i r e 
Phoneme: f I @ r 

40 

Die Zuordnung des Graphems "r" zum Phonem " @"und die Zuordnung des Graphems "e" zum Phonem "r" sind nicht 
korrekt zugeordnet. Diese beiden Zuordnungen treten sehr selten auf, weshalb ihre Haufigkeit kleiner als der Schwell- 
wert ist, so daB sie im Schritt S3 geloscht werden. Zudem wird im Schritt S3 das Wort "fire" wieder als nicht zugeordnet 
markiert, so daB es in einem spateren Zuordnungsschritt wieder untersucht werden kann. 

Im Schritt S4 werden Worter untersucht, die mehr Grapheme als Phoneme besitzen, wobei jeweils ein Graphem einem 45 
Phonem in Leserichtung (von links nach rechts) zugeordnet wird und die verbleibenden Grapheme mit dem letzten Gra- 
phem, dem ein Phonem zugeordnet worden ist, zu einer Graphemeinheit zusammengefaBt werden. Ein Beispiel eines 
Wortes, das auf diese Art und Weise korrekt zugeordnet wird, ist das englische Wort "aback": 

Grapheme: a b a ck 50 
Phoneme: x b @ k 

Im hierauf folgenden Schritt S5 wird wiederum eine Korrektur ausgefuhrt, mit der Zuordnungen geloscht werden, die 
im Widerspruch zu den bisher ermittelten Zuordnungen stehen, das heiBt, Zuordnungen, die nur eine geringe Haufigkeit 
aufweisen. Der Schritt S5 ist diesbezuglich identisch mit dem Schritt S3. 55 

Im Schritt S6 werden die Worter, die mehr Grapheme als Phoneme besitzen und im Schritt S4 nicht korrekt zugeordnet 
werden konnten, von neuem untersucht, wobei jeweils ein einzelnes Graphem einem einzelnen Phonem in Leserichtung 
(von links nach rechts) zugeordnet wird. Jede einzelne Zuordnung wird iiberpriift, ob sie den bisher ermittelten Zuord- 
nungen entspricht. Ergibt diese Uberpriifung, daB eine Graphem-Phonem-Zuordnung nicht den bisherigen Zuordnungen 
entspricht, das heiBt, daB sie nicht die notwendige Haufigkeit besitzt, geht das Verfahren auf die letzte Graphem-Phonem- 60 
Zuordnung zuriick und verbindet das Graphem dieser Graphem-Phonem-Zuordnung mit dem in Leserichtung nachstem 
Graphem zu einer Graphemeinheit. Die ubrigen Phoneme und Grapheme werden dann wieder einander einzeln zugeord- 
net, wobei wiederum jede einzelne Graphem-Phonem-Zuordnung iiberpriift wird. 

Bei diesem Verfahrensschritt konnen innerhalb eines Wortes eine oder mehrere Graphemeinheiten erzeugt werden, 
wobei die Graphemeinheiten in der Regel zwei Grapheme umfassen. Es ist jedoch auch moglich, daB die Graphemein- 65 
heiten drei oder mehr Grapheme umfassen konnen. 

Ein Wort, bei dem der Schritt S6 zu einer erfolgreichen Zuordnung fiihrt ist z. B. das englische Wort "abasement": 
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Grapheme: abasement 
Phoneme: xbes mint 

5 Bei "abasement" erfolgt die paarweise Zuordnung korrekt bis zum Graphem "e" das zunachst dem Phonem "m", zu- 
geordnet wird. Diese Zuordnung steht im Widerspruch zu den bisher ermittelten Zuordnungen, weshalb das Verfahren 
auf die letzte erfolgreiche Zuordnung des Graphems "s" zum Phonem "s" zuriickgeht und das Graphem "s" mit dem Gra- 
phem "e" zur Graphemeinheit "se" verbindet. Die weitere paarweise Zuordnung der Grapheme zu den Phonemen ent- 
spricht wieder den bisher ermittelten Zuordnungen, weshalb sie dementsprechend ausgefuhrt werden. 

10 Im Schritt S7 werden die im Schritt S6 untersuchten Worter, die nicht vollstandig erfolgreich zugeordnet worden sind, 
markiert und deren Zuordnungen werden wiederum geloscht, 

Im Schritt S8 werden die Worter, die mehr Grapheme als Phoneme besitzen und in den Schritten S4 und S6 nicht kor- 
rekt zugeordnet werden konnten, von Neuem untersucht, wobei jeweils ein einzelnes Graphem einem einzelnen Phonem 
zunachst in Leserichtung (von links nach rechts) zugeordnet wird. Jede einzelne Zuordnung wird wiederum iiberpruft, ob 

15 sie den bisher ermittelten Zuordnungen entspricht. Ergibt diese Uberprufung, daB eine Graphem-Phonem-Zuordnung 
nicht den bisherigen Zuordnungen entspricht, das heiBt, daB die Zahl der Haufigkeit unter einem vorbestimmten Schwell- 
wert liegt, werden entgegen der Leserichtung (von rechts nach links) einzelne Grapheme einzelnen Phonemen zugeord- 
net. Bleibt bei dieser Methode lediglich ein Phonem uber, dem kein Graphem zugeordnet werden kann, so werden die 
restlichen Grapheme zu einer Graphemeinheit zusammengefaBt und dem einen Phonem zugeordnet. 

20 Bei diesem Verfahrensschritt kann innerhalb eines Wortes eine Graphemeinheit erzeugt werden. 

Ein Wort, bei dem der Schritt S8 zu einer erfolgreichen Zuordnung fuhrt, ist z. B. das englische Wort "amongst": 

Grapheme: a m o ng s t 
Phoneme: x m A G s t 

25 

Bei "amongst" erfolgt die paarweise Zuordnung von links nach rechts korrekt bis zum Graphem "n", das zunachst dem 
Phonem "G" zugeordnet wird. Diese Zuordnung steht im Widerspruch zu den bisher ermittelten Zuordnungen, weshalb 
eine paarweise Zuordnung von rechts nach links ausgefuhrt wird. Diese Zuordnung verlauft korrekt bis zum Graphem 
"g" das zunachst dem Phonem "G" zugeordnet wird. Diese Zuordnung steht im Widerspruch zu den bisher ermittelten 
30 Zuordnungen. Als einziges Phonem dem kein Graphem zugeordnet werden kann, verbleibt das Phonem "G". Diesem 
Phonem "G" werden nun die restlichen Grapheme "n" und "g", die zu einer Graphemeinheit zusammengefaBt werden, 
zugeordnet. 

Im Schritt S9 werden die im Schritt S8 untersuchten Worter, die nicht vollstandig erfolgreich zugeordnet worden sind, 
markiert und deren Zuordnungen werden wiederum geloscht. 
35 Im Schritt S 10 werden die Worter, die weniger Grapheme als Phoneme besitzen untersucht, wobei die einzelnen Gra- 
pheme den einzelnen Phonemen paarweise zugeordnet werden, wobei die Grapheme auch den zu den zugeordneten Pho- 
nemen benachbarten Phonemen zugeordnet werden. Von all diesen Zuordnungen wird die jeweilige Haufigkeit be- 
stimmt, und falls festgestellt wird, daB ein Graphem zwei benachbarten Phonemen mit einer groBen Haufigkeit zugeord- 
net werden kann, werden diese beiden Phoneme zu einer Phonemeinheit zusammengefaBt, falls die beiden Phoneme 
40 zwei Vokale oder zwei Konsonanten sind. 

Ein Wort, bei dem der Schritt S9 zu einer korrekten Zuordnung fuhrt, ist z. B. das englische Wort "axes": 

Grapheme: ax e s 
45 Phoneme: @ ks i z 

Bei "axes" ergibt die Zuordnungen des Graphems "x" zu den Phonemen "k" und "s" jeweils eine Haufigkeit, die uber 
einem vorbestimmten Schwellwert liegt, so daB diese beiden Phoneme zur Phonemeinheit "ks" zusammengefaBt werden. 
Die ubrigen Grapheme und Phoneme werden wiederum paarweise zugeordnet. 

Im Schritt S 10 ist es auch moglich, daB mehrere Phonemeinheiten gebildet werden oder daB die Phonemeinheiten auch 
50 mehr als zwei Phoneme umfassen. 

Im Schritt Sll wird wiederum eine Korrektur durchgefuhrt, bei der die Zuordnungen, die selten auftreten, geloscht 
werden, und die Worter in denen diese widerspriichlichen Zuordnungen festgestellt worden sind als nicht zugeordnet 
markiert werden. Der Schritt Sll entspricht im wesentlichen den Schritten S3 und S5, wobei hier jedoch auch die bis 
zum Schritt S10 ermittelten Graphem-Phonem-Zuordnungen beriicksichtigt werden. 
55 Der Schritt S12 entspricht im wesentlichen dem Schritt S10, das heiBt, daB Phonemeinheiten aus benachbarten Pho- 
nemen gebildet werden, wobei im Schritt S12 die Phonemeinheiten nicht auf zwei Konsonanten oder zwei "fokale be- 
schrankt sind, sondern auch eine Mischung aus Vokalen und Konsonanten beinhalten konnen. 

Im Schritt S13 wird wiederum ein Korrekturvorgang durchgefuhrt, der dem des Schrittes Sll entspricht, wobei alle 
mittlerweile ermittelten Graphem-Phonem-Zuordnungen beriicksichtigt werden. 
60 Im Schritt S14 werden die in den Schritten S10 und S12 ermittelten Phonemeinheiten verwendet, um Worter, deren 
Grapheme nicht den Phonemen korrekt zugeordnet werden konnten, erneut zu untersuchen, wobei fur benachbarte Pho- 
neme, fur die bereits eine Phonemeinheit existiert, diese eingesetzt wird. Optional ist es auch moglich, daB die bisher er- 
mittelten Graphemeinheiten beriicksichtigt werden. Sollte von dieser Option kein Gebrauch gemacht werden, konnen 
hier Graphemeinheiten erneut gemaB den Methoden nach den Schritten S4, S6 und S8 gebildet werden. 
65 Ein Wort, das die Zuordnung gemaB dem Schritt S 14 zeigt, ist das englische Wort "accumulated": 
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Grapheme: accumulated 
Phoneme: xk yumyxletld 

Bei diesem Wort werden zunachst die Phoneme "y" und "u" bzw. "y" und "x" durch die Phonemeinheiten "yu" bzw. 5 
"yx" ersetzt. Da diese Phonemeinheiten bereits bei den vorhergehenden Schritten ermittelt worden sind, wird im Schritt 
S14 von der Option Gebrauch gemacht, daB auch die Graphemeinheiten berucksichtigt werden, so wird fur die beiden 
Grapheme "c" und "c" die Graphemeinheit "cc" verwendet. Die paarweise Zuordnungen der einzelnen Grapheme bzw. 
Graphemeinheiten zu den einzelnen Phonemen bzw. Phonemeinheiten ergibt eine korrekte Zuordnung. 

Wird von der Option der Beriicksichtigung der Graphemeinheiten kein Gebrauch gemacht, so werden, wie es im 10 
Schritt S6 der Fall ist, die einzelnen Grapheme den einzelnen Phonemen bzw. Phonemeinheiten zugeordnet, wobei im 
vorliegenden Fall bei der Zuordnung des Graphems "c" zu der Phonemeinheit "yu" eine zu den bisherigen Zuordnungen 
widerspriichliche Zuordnung erfolgt. Diese widerspriichliche Zuordnung wird festgestellt und das Graphem "c" wird mit 
dem vorhergehenden Graphem "c" zu "cc" zusammengefaBt. Dies fiihrt wiederum zu einer korrekten Zuordnung der 
Grapheme zu den Phonemen. 15 

Im Schritt S 15 wird wiederum gepruft, ob widerspriichliche Zuordnungen erfolgt sind. Werden derartige widerspriich- 
liche Zuordnungen festgestellt, werden sie und die weiteren Zuordnungen des jeweiligen Wortes geloscht. 

Mit dem Schritt S16 wird das Verfahren beendet. 

Die Anzahl der im Schritt S15 ermittelten widerspriichlichen Zuordnungen ist ein Merkmal fur die Qualitat der Auf- 
bereitung der Ausgangsdatenbank zu der durch das Verfahren erhaltenen Datenbank mit den einzelnen Graphem-Pho- 20 
nem-Zuordnungen. 

Das erfindungsgemaBe Verfahren konnte schon sehr erfolgreich zur automatischen Erstellung einer Datenbank fur die 
deutsche Sprache eingesetzt werden, wobei eine Zuordnungsdatenbank mit insgesamt47 Phonemen und 92 Graphemen 
aufgebaut worden ist. Bei der Erstellung der Datenbank fur die englische Sprache, die eine wesentlich kompliziertere 
Graphem-Phonem-Zuordnung besitzt, ergaben sich 62 Phoneme und 222 Grapheme, deren Zuordnungen nicht so gut 25 
wie bei der deutschen Sprache war. Die groBere Anzahl von Graphemen in der englischen Sprache macht deren Bearbei- 
tung kompliziert. Es kann deshalb zweckmaBig sein, ein Null-Phonem einzufuhren, das heifit ein Phonem ohne einen 
Laut. Ein derartiges Null-Phonem kann z. B. der englischen Graphemeinheit "gh" zugeordnet werden, das in der engli- 
schen Sprache stimmlos in Kombination mit den Graphemen "ei", "ou" und "au" vorkommt. Wiirde man kein derartiges 
Null-Phonem einfiihren, muBte man zusatzlich zu den Graphemen "ei", "ou" und "au" die Phoneme "eigh", "ough" und 30 
"augh" einfuhren. Das Null-Phonem erlaubt eine Verringerung der Anzahl der Grapheme, da "eigh", "ough" und "augh" 
jeweils durch "ei", "ou" und "au" in Kombination mit "gh" ersetzt werden konnen. Hierdurch kann die Zuverlassigkeit 
des Verfahrens gesteigert werden. Insbesondere erlaubt eine geringere Anzahl von Phonemen bzw. Graphemen eine ein- 
fachere, schnellere und zuverlassigere Anwendung bei einem neuronalen Netzwerk, das mittels der mit dem erfindungs- 
gemaBen Verfahren erstellten Datenbank txainiert wird. 35 

Ein solches neuronales Netzwerk ist in Fig. 2 schematisch vereinfacht dargestellt, das fiinf Eingangsknoten und zwei 
Ausgangsknoten aufweist. An drei der fiinf Eingangsknoten werden drei aufeinanderfolgende Buchstaben Bl, B2 und 
B3 eines Wortes, das in Phoneme umgesetzt werden soli, eingegeben. Auf der Ausgangsseite gibt es zwei Knoten, wobei 
einer der beiden das jeweilige Phonem Ph und der andere Knoten eine Gruppierung Gr ausgibt. An den beiden weiteren 
Eingangsknoten wird die zuletzt ausgegebene Gruppierung Gr t und das zuletzt ausgegebene Phonem Phi eingegeben. 40 

Dieses Netzwerk wird mit den Wortern der mit dem erfindungsgemaBen Verfahren aufbereiteten Datenbank txainiert, 
deren Graphem-Phonem-Zuordnungen keinen Widerspruch zu den ubrigen Graphem-Phonem-Zuordnungen darstellen, 
das heiBt, den Wortem, deren Grapheme korrekt den Phonemen zugeordnet werden konnten. 

Das neuronale Netzwerk ermittelt jeweils fur den mittleren Buchstaben B2 ein Phonem, wobei der jeweils im Kontext 
vorhergehenden und nachfolgende Buchstabe und das dem zu ermittelnden Phonem vorhergehende Phonem Phi beriick- 45 
sichtigt werden. Stellen die beiden aufeinanderfolgenden Buchstaben B2 und B3 eine Graphemeinheit dar, so ergibt sich 
eine Ausgabe fiir die Gruppierung Gr von zwei. Ist der Buchstabe B2 kein Bestandteil einer aus mehreren Buchstaben be- 
stehenden Graphemeinheit, so wird als Gruppierung Gr eine eins ausgegeben. 

^ Auf der Eingangsseite wird die jeweils letzte Gruppierung Gr : beriicksichtigt, wobei im Falle einer Gruppierung von 
Gr t von zwei dem mittleren Buchstaben B2 kein Phonem Ph zugeordnet wird, da dieser Buchstabe bereits mit der letzten 50 
Graphemeinheit berucksichtigt worden ist. In diesem Fall wird der zweite Buchstabe der Gruppierung ubersprungen. 

Beim Training des neuronalen Netzwerkes werden, wie es an sich bekannt ist, jeweils die Werte fiir die Eingangskno- 
ten und fiir die Ausgangsknoten dem neuronalen Netzwerk vorgegeben, wodurch sich das neuronale Netzwerk die jewei- 
ligen Zuordnungen im Kontext der Worter aneignet. 

Es kann zweckmaBig sein, mehr als drei Buchstaben an der Eingangsseite des neuronalen Netzwerkes vorzusehen, ins- 55 
besondere bei Sprachen, wie der englischen Sprache, in welcher mehrere Buchstaben zur Darstellung eines einzigen 
Lautes verwendet werden. Fur die deutsche Sprache ist es zweckmaBig an der Eingangsseite drei oder fiinf Knoten zur 
Eingabe von Buchstaben vorzusehen, wohingegen fur die englische Sprache fiinf, sieben oder sogar neun Knoten zur 
Eingabe von Buchstaben zweckmaBig sein konnen. Bei neun Knoten konnen Graphemeinheiten mit bis zu funf Buchsta- 
ben behandelt werden. 60 

Ist das neuronale Netzwerk einmal mit der erfindungsgemaBen Datenbank trainiert worden, kann es zur automatischen 
Erzeugung von Sprache verwendet werden. Eine Vorrichtung zum Erzeugen von Sprache, in der das erfindungsgemaBe 
neuronale Netzwerk eingesetzt werden kann, ist schematisch in Fig. 3 gezeigt. 

Diese Vorrichtung ist eine elektronische Datenverarbeitungsvorrichtung 1 mit einem internen Bus 2, an dem eine zen- 
trale Prozessoreinheit 3, eine Speichereinheit 4, ein Interface 5 und eine akustische Ausgabeeinheit 6 angeschlossen sind. 65 
Das Interface 5 kann iiber eine Datenleitung 8 eine Verbindung zu einer weiteren elektronischen Datenverarbeitungsvor- 
richtung herstellen. An der akustischen Ausgabeeinheit 6 ist ein Lautspreeher 7 angeschlossen. 

In der Speichereinheit 4 ist das erfindungsgemaBe neuronale Netzwerk in Form eines Computerprogrammes abgespei- 
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chert, das mittels der zentralen Prozessoreinheit 3 zur Ausfuhrung gebracht werden kann. Ein Text, der der elektroni- 
schen Datenverarbeitungsvorrichtung auf beliebige Weise, z. B. iiber das Interface 5, zugefuhrt wird, kann dann mit ei- 
nem entsprechenden Hilfsprogramm dem neuronalen Netzwerk zugefuhrt werden, das die Grapheme, bzw. Buchstaben 
des Textes in entsprechende Phoneme umsetzt. Diese Phoneme werden in einer Phonem-Datei gespeichert, die iiber den 
S internen Bus 2 an die akustische Ausgabeeinheit 6 weitergegeben wird, mit der die einzelnen Phoneme in elektrische Si- 
gnale umgesetzt werden, die vom Lautsprecher 7 in akustische Signale gewandelt werden. 

Mit einer solchen elektronischen Datenverarbeitungsvorrichtung 1 kann auch das erfindungsgemaBe Verfahren zum 
Aufbereiten einer Datenbank ausgefuhrt werden, wobei das Verfahren wiederum in Form eines Computerprogrammes 
im Speicher 4 gespeichert ist und von der zentralen Prozessoreinheit 3 zur Ausfuhrung gebracht wird, wobei es eine Aus- 
10 gangsdatenbank, die ein Worterbuch in Schreib- und Lautschrift darstellt, in eine Datenbank aufbereitet, in der die ein- 
zelnen Laute, die Phoneme, den einzelnen Buchstaben bzw. Buchstabenkombinationen, den Graphemen zugeordnet 
sind. 

Die Zuordnung der einzelnen Grapheme zu den einzelnen Phonemen kann in der aufbereiteten Datenbank durch Leer- 
zeichen gespeichert werden, die zwischen den einzelnen Phonemen und Graphemen eingefugt werden. 
15 Die das erfindungsgemaBe Verfahren bzw. das neuronale Netzwerk darstellenden Computerprogramme konnen auch 
auf beliebige elektronisch lesbare Datentrager gespeichert werden und so auf eine weitere elektrische Datenverarbei- 
tungsvorrichtung ubertragen werden. 

Die Erfindung ist oben anhand eines Ausfuhrungsbeispieles Beschrieben, mit dem eine Datenbank fur die Sprachsyn- 
these erzeugt wird. Im Rahmen der Erfindung ist es selbstverstandlich auch moglich, die erfindungsgemaB erzeugte Da- 
20 tenbank bei der Spracherkennung zu verwenden, da Spracherkennungsverfahren oftmals Datenbanken mit Graphem- 
Phonem-Zuordnungen gebrauchen. 

Eine Spracherkennung kann bspw. mit einem neuronalen Netzwerk ausgefuhrt werden, das mit der erfindungsgemaB 
erstellten Datenbank trainiert worden ist. An der Eingangsseite weist dieses neuronale Netzwerk vorzugsweise drei Ein- 
gangsknoten auf, an welchen das in ein Graphem umzusetzende Phonem eingegeben und falls vorhanden zumindest ein 
25 im Wort vorhergehendes und ein nachfolgendes Phonem eingegeben werden. An der Ausgangsseite weist das neuronale 
Netzwerk einen Knoten auf, an dem das dem Phonem zugeordnete Graphem ausgegeben wird. 

Im Rahmen der Erfindung liegt somit jede Anwendung des Erstellens und Anwenden der erfindungsgemaB erstellten 
Datenbank im Bereich der automatischen Sprachverarbeitung. 

30 Patentanspriiche 

1. Verfahren zum Aufbereiten einer Datenbank fur die automatische Sprachverarbeitung, bei welchem anhand der 
Worter in Form von Graphemen und Phonemen enthaltenden Datenbank eine Zuordnung der Grapheme zu den 
Phonemen erstelit wird, umfassend folgende Schritte: 

35 a) Zuordnen der Grapheme zu den Phonemen aller Worter, die dieselbe Anzahl Grapheme und Phoneme be- 

sitzen, wobei die Grapheme und Phoneme einander paarweise zugeordnet werden, 

b) Zuordnen der Grapheme zu den Phonemen aller Worter, die mehr Grapheme als Phoneme besitzen, wobei 
zunachst alle Grapheme den Phonemen paarweise zugeordnet werden, bis sich ein Zuordnungsfehler auf 
Grundlage der bisher ermittelten Zuordnungen ergibt oder lediglich am Wortende ein oder mehrere Grapheme 

40 vorhanden sind, die keinem Phonem zugeordnet sind, und Zusammenfassen mehrerer Grapheme zu einer Gra- 

phemeinheit und Zuordnen eines Graphems zu der Phonemeinheit, und 

c) Zuordnen der Grapheme zu den Phonemen aller Worter, die weniger Grapheme als Phoneme besitzen, wo- 
bei mehrere Phoneme zu einer Phonemeinheit zusammengefaBt werden und ihnen ein einziges Graphem derart 
zugeordnet wird, daB die ubrigen Graphem-Phonem-Zuordnungen des zu analysierenden Wortes den unter a) 

45 und b) gefundenen Zuordnungen entsprechen, 

d) Zuordnen der bisher nicht zuordbaren Worter, wobei die Worter nach den unter c) ermittelten Phonemein- 
heiten und/oder den unter b) ermittelten Graphemeinheiten untersucht werden und die Grapheme zu den Pho- 
nemen unter Beriicksichtigung der Phonemeinheiten und/oder Graphemeinheiten zugeordnet werden, und 

wobei zumindest nach Schritt a) ein Korrekturschritt ausgefuhrt wird, mit dem Zuordnungen von Wortern, die im 
50 Widerspruch zu den im Schritt a) ermittelten weiteren Zuordnungen stehen, geloscht werden. 

2. Verfahren nach Anspruch 1, 
dadurch gekennzeichnet, 

daB nach jedem der Schritte a) bis d) ein Korrekturschritt ausgefuhrt wird, mit dem Zuordnungen von Wortern, die 
im Widerspruch zu den in den jeweiligen Schritten bzw. Teilschritten ermittelten weiteren Zuordnungen stehen, ge- 
55 loscht werden. 

3. Verfahren nach Anspruch 1 oder 2, 
dadurch gekennzeichnet, 

daB der Korrekturschritt auf Grundlage einer Statistik ausgefuhrt wird, mit welcher die Haufigkeit der einzelnen 
Graphem-Phonem-Zuordnungen erfaBt wird, wobei mit dem Korrekturschritt ermittelt wird, welche Zuordnungen 
60 eine Haufigkeit aufweisen, die unter einem vorbestimmten Schwellwert liegt, und diese Zuordnungen loscht. 

4. Verfahren nach Anspruch 3, 
dadurch gekennzeichnet, 

daB die Worter, die eine geloschte Zuordnung enthalten als nicht zugeordnet markiert werden, so daB sie bei einem 
der nachfolgenden Schritte wieder beriicksichtigt werden konnen. 
65 5. Verfahren nach einem der Anspriiche 1 bis 4, 

dadurch gekennzeichnet, 

daB beim Zuordnen der Grapheme zu den Phonemen aller Worter, die weniger Grapheme als Phoneme besitzen, le- 
diglich Vokale oder Konsonanten zu einer Phonemeinheit zusammengefaBt werden. 
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6. Verfahren nach einem der Anspriiche 1 bis 4, 
dadurch gekennzeichnet, 

daB beim Zuordnen der Grapheme zu den Phonemen aller Worter, die weniger Grapheme als Phoneme besitzen, zu- 
nachst Vokale oder Konsonanten in einer Phonemeinheit zusammengefaBt und entsprechend dem Schritt c) zuge- 
ordnet werden, und falls weiterhin Worter, die weniger Grapheme als Phoneme besitzen, nicht zugeordnet werden 
kQnnen, auch Vokale mit Konsonanten zu einer Phonemeinheit zusammengefaBt und entsprechend dem Schritt c) 
zugeordnet werden. 

7. Verfahren nach einem der Anspriiche 1 bis 6, 
dadurch gekennzeichnet, 

daB beim Zuordnen der Grapheme zu den Phonemen aller Worter, die mehr Grapheme als Phoneme besitzen, das 
oder die restlichen, am Wortende vorgesehenen Grapheme, zusammen mit dem letzten Graphem, das dem letzten 
Phonem des Wortes zugeordnet worden ist, zu einer Graphemeinheit zusammengefaBt wird und die dem letzten 
Phonem des Wortes zugeordnet wird. 

8. Verfahren nach Anspruch 7, 
dadurch gekennzeichnet, 

daB falls sich ein Zuordnungswiderspruch auf Grundlage der bisher ermittelten Zuordnungen ergibt, an die langste 
zuordnungswiderspruchsfreie Kette von Graphemen das nachste Graphem mit dem letzten Graphem der Kette zu 
einer Graphemeinheit zusammengefaBt und die Zuordnung emeut versucht wird, wobei falls wiederum keine Gra- 
phem-Phonem-Zuordnung erstellt werden kann, das nachste Graphem mit der zuletzt gebildeten Graphemeinheit 
zusammengefaBt und die Zuordnung emeut versucht wird. 
Verfahren nach Anspruch 8, 



daB, falls keine Graphem-Phonem-Zuordnung eines Wortes mit mehreren Graphemen als Phonemen erzielt werden 
kann, die Zuordnung zunachst mit einer am Anfang des Wortes beginnenden paarweisen Zuordnung gestartet wird, 
bis sich ein Zuordnungswiderspruch auf Grundlage der bisher ermittelten Zuordnungen ergibt, worauf eine am 
Ende des Wortes beginnende paarweise Zuordnung ausgefiihrt wird, und wenn lediglich ein einzelnes nicht zuge- 
ordnetes Phonem ubrig bleibt, werden die restlichen Grapheme zu einer Graphemeinheit zusammengefaBt und dem 
einen nicht zugeordnetem Phonem zugeordnet. 

10. Verfahren zum Trainieren eines neuronalen Netzwerkes zum Zuordnen von Graphemen zu Phonemen fur die 
automatische Sprachverarbeitung, 

dadurch gekennzeichnet, 

daB das neuronale Netzwerk mit einer nach dem Verfahren der Anspriiche 1 bis 9 aufbereiteten Datenbank trainiert 
wird, wobei die Grapheme an Eingangsknoten und die zugehorigen Phoneme an einem Ausgangsknoten des neuro- 
nalen Netzwerkes eingegeben werden. 

11. Verfahren zum Zuordnen von Graphemen zu Phonemen bei der Synthetisierung von Sprache, 
dadurch gekennzeichnet, 

daB die Graphem-Phonem-Zuordnung durch eine Zuordnung eines Ausgangsmusters zu einem Eingangsmusters 
des nach dem Verfahren des Anspruchs 10 trainiertem neuronalen Netzwerkes ausgefiihrt wird, wobei das Ein- 
gangsmuster zumindest den zuzuordnenden Buchstaben und falls vorhanden zumindest einen im Wort vorherge- 
henden und einen nachfolgenden Buchstaben umfafit und das Ausgangsmuster ein Phonem aufweist. 

12. Verfahren nach Anspruch 11, 
dadurch gekennzeichnet, 

daB das Eingangsmuster mehrere dem zuzuordnenden Buchstaben vorhergehende und nachfolgende Buchstaben 
umfaBt, wobei es vorzugsweise jeweils drei vorhergehende und nachfolgende Buchstaben umfaBt. 

13. Verfahren nach Anspruch 11 oder 12, 
dadurch gekennzeichnet, 

daB das Eingangsmuster das letzte Ausgangsmuster umfaBt. 

14. Verfahren nach einem der Anspriiche 11 bis 13, 
dadurch gekennzeichnet, 

daB das Ausgangsmuster eine Gruppierung der Buchstaben, d. h., die Anzahl der zu einer Graphemeinheit im Ein- 
gangsmuster zusammengefaBten Buchstaben aufweist. 

15. Verfahren zum Zuordnen von Phonemen zu Graphemen bei der Erkennung von Sprache, 
dadurch gekennzeichnet, 

daB die Graphem-Phonem-Zuordnung durch eine Zuordnung eines Ausgangsmusters zu einem Eingangsmusters 
des nach dem Verfahren des Anspruchs 10 trainiertem neuronalen Netzwerkes ausgefiihrt wird, wobei das Ein- 
gangsmuster zumindest das zuzuordnende Phonem und falls vorhanden ein im Wort vorhergehendes und ein nach- 
folgendes Phonem umfaBt und das Ausgangsmuster einen Buchstaben aufweist. 

16. Neuronales Netzwerk fur die automatische Sprachverarbeitung, mit welchem automatisch eine Zuordnung zwi- 
schen Graphemen und Phonemen hergesteEt werden kann, 

dadurch gekennzeichnet, 

daB das neuronale Netzwerk gemaB dem Verfahren nach Anspruch 10 trainiert worden ist. 

17. Neuronales Netzwerk nach Anspruch 16, 
dadurch gekennzeichnet, 

daB es auf einem elektronisch lesbaren Datentrager gespeichert ist. 
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